实测：神乎其神的ChatGPT能否取代新闻工作者？

马兰 TMT时报 2023-02-22

实践出真知，近期大火的人工智能ChatGPT是不是真的会替代你我的工作？

财联社2月1日讯（编辑马兰）春节期间，一部《流浪地球2》点燃了全民的科幻热情，影片中的数字生命“图丫丫”就仿佛是人工智能的投射，集中了人们对人工智能的所有期待。

而OpenAI去年年底发布的ChatGPT则让不少国内投资人的科幻热情得到了寄托，带动人工智能一词在A股市场持续刷屏。

很多人体验完ChatGPT之后，将其夸的神乎其神，例如体验感很真实，比目前通用的人工智能客服都更会“讲人话”，逻辑畅通，思路清晰……仿佛是电影中数字生命的现实版本。

还有人更是忧心忡忡，ChatGPT可以模仿人类写诗甚至写歌，用不了多久，人类大规模失业可能就会出现！

然而，多位人工智能界专家及其相关研究报告都在强调ChatGPT技术上所存在的壁垒，例如这一语言模型很难应用于精确或可信度要求高的工作之中。

这一缺点并不难在实探中得到印证。这既是该项技术未来可能进步的方向，也可能为商业化设想提供了“负面清单”。

▌假如你是一名财经编辑

财联社编辑在亲身试用ChatGPT之后，让她大舒一口气的是：财经新闻还是得靠人来写。

2020年，OpenAI曾在一篇论文中表示，其GPT-3生成的新闻文章样本，让人类很难识破是由机器生产的文章。

这一点让人感到好奇，于是在近日实探中，我们向ChatGPT发送如下指令：请以一名专业的财经类主编身份点评一则报道。随之附上的是去年财联社关于全球富豪排行变动的一条新闻。

不难发现，ChatGPT的回答虽然有条有理，但颇为死板，像是高中语文的阅读理解。

此外，ChatGPT还在另一次测试中出现了张冠李戴的问题，当输入一篇短篇报道并要求ChatGPT进行扩写时，不仅出现了原文中从未有过的材料，更是出现了数字谬误。

文中红线标划之处都是ChatGPT的即兴发挥，有关比尔盖茨、李嘉诚包括此后对欧洲、亚洲富豪的叙述都是新产生的文本。而据调查，所谓比尔盖茨在2022年减少350亿美元身价，实际上应该为290亿美元，350亿美元应该为他截至2019年累计捐赠的数额。

在另一个问题的测试中，ChatGPT也坦诚了自己的局限。由于其储存资料的时间限制在2021年前，所有2022年以后发生的事情其实在它的“大脑”里都无法正确处理。

人工智能确实能够生成一些几能乱真的新闻报道，但背后却仍需要人工对事实进行不断的核查。仅从这个角度来看，ChatGPT并没有解放多少生产力。

而从其行文来看，其中并不带很多的感染力，这也让它在艺术创作方面无法与人类媲美。

这就让这款人工智能有些进退两难：若从事专业写作，读者不得不质疑其准确性；而从事艺术创作，它又没有丰富的表现力。

▌一致性问题

ChatGPT是建立在Instruction GPT（GPT-3的分支模型）上的语言模型，依托于Transformer模型，与上一代RNN模型相比，在处理速度和多任务处理上实现革新。

ChatGPT的语言模型在预训练阶段，被填鸭式塞进了过滤前容量达45TB的压缩文本，且过滤后也有570GB的海量数据，然后再通过多次的举一反三来增加准确率。

在ChatGPT的逻辑里，“你”后面可以跟的字有不同的概率，可以是“你好”，也可以是“你们”等等，它需要做的是，就是回溯上文来推导下一个字最可能跟哪一个字。

而以前的RNN模型则是通过标记海量的数据集，先教会人工智能什么是对的，再让其进行判断。如果说RNN模型是严格按照原文做阅读理解，那么GPT则做到了完形填空。

这就使得以Transformer为基础的人工智能可以通过旁征博引来跳出“输入”的前提，这大大缓解了“教学压力”。

当然，带来的后果也已经显现：“跳脱”的人工智能很可能用一个词改变整个语境。

就如试验中出现的马斯克反转。在原文只给出马斯克因收购推特而导致特斯拉股票暴跌，并让他自己财富缩水的线索时，ChatGPT神来一笔地表示：马斯克对此并不悔恨，甚至很有信心。

啼笑皆非的是，马斯克本人可能并没有这样想。

而将这一问题深入思考，如果人们以后要求ChatGPT处理其它问题时，也出现了这样的情况怎么办？

比如，相亲网站的智能客服回答客户时，AI突然来一句离婚率连年上涨的话怎么办？或是在合同撰写中，AI标注了错误的金额怎么办？

▌被“玩坏”的ChatGPT未来在何处？

大火之后，流量明星ChatGPT现在终于不得不陷入尴尬的境地：问的人太多，它回答不过来了。

其团队苦心孤诣简化逻辑，提高计算速度仍难以满足人类的好奇心，此刻的ChatGPT如同被问烦了的人类，陷入了“自闭”之中。

抛开它被吹捧的外衣，ChatGPT实际上依靠的仍是人工智能领域十分底层的技术，算法虽然有所改进，但其本身依旧受制于程序员圈定的逻辑和硬件支持之中。

而ChatGpt本身也可能只是一个半成品，其在网上试用的最主要目的在于进行更多的测试训练，以便产生更多的有效标注数据。

换句话说，你我现在都是ChatGPT的免费教练。

值得期待的是，种种迹象表明，OpenAI很有可能在2023年推出GPT-4技术，将在GPT-3模型基础上继续优化。

在获得了全球免费教练的“贴心指导”后，我们有理由相信OpenAI将会打造一个更具人性化，更智能的ChatGPT 2.0，并在商业中落地。甚至，我们也可以期待有一天ChatGPT可以真正从事需要高可信度的工作，而不会无辜地去捏造事实。

但仅就ChatGPT而言，这头“新贵猪”可能还需要在风口再等一等。

高三女生醉酒后被强奸致死？检方回应

常德悲剧：让谴责无差别杀戮之声更加响亮一点

2024【公共营养师】培训报名通道已开启，不限学历，23岁及以上可报！还能领2000补贴

【惊】"以为要写遗书"! 飞温哥华航班遇炸弹气旋华人崩溃大哭连空姐都吐了; 客机颠簸盘旋3小时

女人最偏爱的十种男人

实测：神乎其神的ChatGPT能否取代新闻工作者？

▌假如你是一名财经编辑

▌一致性问题

▌被“玩坏”的ChatGPT未来在何处？

您可能也对以下帖子感兴趣

高三女生醉酒后被强奸致死？检方回应

常德悲剧：让谴责无差别杀戮之声更加响亮一点

2024【公共营养师】培训报名通道已开启，不限学历，23岁及以上可报！还能领2000补贴

【惊】"以为要写遗书"! 飞温哥华航班遇炸弹气旋 华人崩溃大哭 连空姐都吐了; 客机颠簸盘旋3小时

女人最偏爱的十种男人

生成图片，分享到微信朋友圈

实测：神乎其神的ChatGPT能否取代新闻工作者？

▌假如你是一名财经编辑

▌一致性问题

▌被“玩坏”的ChatGPT未来在何处？

您可能也对以下帖子感兴趣

【惊】"以为要写遗书"! 飞温哥华航班遇炸弹气旋华人崩溃大哭连空姐都吐了; 客机颠簸盘旋3小时